کاهش اختلال در دسته بندی چند برچسبی نیمه نظارتی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر
  • نویسنده نیما علی نیا
  • استاد راهنما ناصر قاسم اقایی
  • سال انتشار 1393
چکیده

امروزه دسته¬بندی چندبرچسبی نیمه¬نظارتی در زمینه¬های بسیاری ازجمله دسته¬بندی متن و داده¬های بیوانفورماتیکی مورد استفاده قرار می¬گیرد. یادگیری نیمه¬نظارتی، برای آموزش دسته¬بند، علاوه بر نمونه¬های برچسب¬دار از نمونه¬های بدون برچسب نیز به منظور تقویت مجموعه آموزشی بهره¬ می¬برد. بااین حال، ممکن است در هر مرحله از این یادگیری، برچسب¬گذاری نادرست نمونه¬های بدون برچسب، باعث به وجود آمدن اختلال در مجموعه آموزشی شود. در این پژوهش سعی می¬شود تا روشی برای شناسایی و حذف اختلال از مجموعه داده¬ آموزشی در دسته¬بندی چند برچسبی نیمه¬نظارتی ارائه داده شود. در این پژوهش الگوریتمی بانام mlstcf ارائه می¬شود که از نگرش خودآموزی به¬عنوان روش نیمه¬نظارتی استفاده می¬کند. در هر مرحله از نگرش خودآموزی، الگوریتمی بانام فیلتر دسته¬بندی برای شناسایی و حذف اختلال به کار می¬رود. همچنین در هر مرحله از نگرش خودآموزی روشی جدید برای انتخاب نمونه¬های بدون برچسبی که دارای اطلاعات مفید هستند و همچنین روشی برای انتخاب مطمئن¬ترین نمونه¬ها ارائه می¬شود. درنهایت، الگوریتم پیشنهادی با استفاده از دو مجموعه داده معتبر با نام¬های flags و emotions مورد ارزیابی قرار می¬گیرد. در این پژوهش، 16 معیار ارزیابی مهم در دسته¬بندی چند برچسبی برای مقایسه الگوریتم پیشنهادی با دو الگوریتم mlknn وmlste در نظر گرفته می¬شود. نتایج نشان می¬دهد که الگوریتم پیشنهادی این پژوهش در مقایسه با دو الگوریتم دیگر، در دسته¬بندی مجموعه داده¬های چندبرچسبی که در آن¬ها تعداد نمونه¬های برچسب¬دار، کم و تعداد نمونه¬های بدون برچسب زیاد است موثرتر است.

منابع مشابه

دسته بندی داده های چند برچسبی با استفاده از سامانه های دسته بندی یادگیرنده

دسته بندی یکی از مهمترین فرآیندهای مورد مطالعه در حوزه یادگیری ماشین و داده کاوی است که در برنامه های کاربردی فراوانی از جمله دسته بندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورد استفاده قرار می گیرد. مسائل دسته بندی را می توان براساس تعداد برچسب های منتسب به هر یک از داده ها به دو دسته کلی مسائل دسته بندی تک برچسبی و مسائل دسته بندی چند برچسبی تقسیم کرد. در مسائل دسته بندی تک برچسبی، هر داده دا...

یک روش مبتنی بر یادگیری نیمه نظارتی برای طبقه بندی داده های چند رابطه ای

یکی از زمینه های کاربردی روش های یادگیری ماشین و تشخیص الگو در زمینه ی تجارت هوشمند برای سازمان ها می باشد. روش های تجارت هوشمند سازمان ها را قادر می سازد که تحلیل خردمندانه ای داشته باشند و تصمیم های به موقع و هوشمندانه اخذ کنند که تغییرات قابل ملاحظه ای در رقابت خود و شرایط بازار ایجاد کنند. بنابراین کاوش دانش روی داده های واقعی با استفاده از روش های یادگیری ماشین بسیار پرارزش می باشد. هرچند،...

ناحیه بندی وفقی و نیمه نظارتی تومور در تصاویر mri

ناحیه بندی بافت مغز با هدف تفکیک دقیق بافت آسیب دیده یا بیمار مغز، یکی از مراحل اساسی در فرآیند تشخیص و درمان ناهنجاریهای بافت مغز است. اما ناحیه بندی عموما توسط رادیولوژیستها و متخصصین انکولوژی بصورت دستی صورت میگیرد که ضمن خسته کننده و دشواربودن از خطای انسانی نیز مصون نیست. پیچیدگی این فرآیند لزوم طراحی و استفاده از یک متد خودکار یا نیمه خودکار را مشخص میسازد. مطلوب اینست که روشی که برای ای...

15 صفحه اول

حاشیه‌نویسی تصویر با استفاده از الگوریتم خوشه‌بندی نیمه نظارتی طیفی

Abstract: Due to the growth of digital images require efficient methods to annotate the images is sense. In this paper, a semi-supervised spectral clustering with relevance feedback is used to annotate digital photos which is overcome the local minima problem on clustering methods by using some labeled information given by users. Performance of the proposed method is tested on Corel 5K dataset ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023